19 research outputs found

    MultiSubs: A Large-scale Multimodal and Multilingual Dataset

    Full text link
    This paper introduces a large-scale multimodal and multilingual dataset that aims to facilitate research on grounding words to images in their contextual usage in language. The dataset consists of images selected to unambiguously illustrate concepts expressed in sentences from movie subtitles. The dataset is a valuable resource as (i) the images are aligned to text fragments rather than whole sentences; (ii) multiple images are possible for a text fragment and a sentence; (iii) the sentences are free-form and real-world like; (iv) the parallel texts are multilingual. We set up a fill-in-the-blank game for humans to evaluate the quality of the automatic image selection process of our dataset. We show the utility of the dataset on two automatic tasks: (i) fill-in-the blank; (ii) lexical translation. Results of the human evaluation and automatic models demonstrate that images can be a useful complement to the textual context. The dataset will benefit research on visual grounding of words especially in the context of free-form sentences, and can be obtained from https://doi.org/10.5281/zenodo.5034604 under a Creative Commons licence.Comment: Manuscript update: (i) Added links to the dataset and evaluation toolkit; (ii) Section 6.1.4: Added random and n-gram baselines to the fill-in-the-blank task, and added further discussion at the end of the section; (iii) Section 6.2.3: Further elaboration on the ALI metric; (iv) Section 6.2.4: Corrected results for the lexical translation task (Table 8), and updated the discussions accordingl

    Discussão acerca de alguns aspectos da gestão da inovação em Mato Grosso – Brasil

    Get PDF
    This article analyzes the relationship between the importance attached to innovation by a portion of their managers in Mato Grosso and the actions to generate new technologies. It is observed that is attributed centrality of technological innovation for the competitiveness of enterprises, but the development of new products, processes or services is incipient. From Schumpeter's and the "triple helix’s" theory of innovation, the data are explained by a lack of "leadership" can make the interactions between the actors are not only tangential but overlapping, so as to generate synergy network.Este artigo analisa a relação entre a importância atribuída à inovação por uma parcela de seus gestores em Mato Grosso e as ações para gerar novas tecnologias. Observa-se que se atribui centralidade à inovação tecnológica para a competitividade das empresas, mas o desenvolvimento de novos produtos, processos ou serviços é incipiente. A partir da teoria de Schumpeter e da “tripla hélice” sobre a inovação, os dados são explicados pela ausência de uma “liderança” capaz de fazer com que as interações entre os atores não sejam apenas tangenciais, mas sobrepostas, de modo a gerar sinergia em rede. Palavras-chave: Inovação; Sinergia; Gestores de inovação; Universidade; Empresa

    Análise de carbono elementar do Pantanal Mato-grossense através do Método de Análise de Espectro Singular (SSA)

    Get PDF
    Este estudo mostra como o método não paramétrico de Análise de Espectro Singular (SSA Singular Spectrum Analysis) pode ser utilizado para analisar a tendência do carbono elementar na série temporal dos anos 2012-2013. O método foi aplicado para analisar o comportamento dos valores de carbono elementar mensal registrado na estação Pantanal, localizada na Baía das Pedras, no Pantanal Mato-grossense, Brasil. Os resultados mostram que o período é capaz de extrair as componentes da tendência e ruídos das séries temporais. As séries reconstruídas reproduziram satisfatoriamente o comportamento não linear das séries originais, indicando que o método pode ser considerado como uma nova ferramenta de auxílio nas concentrações de carbono elementar

    Blockchain na Agricultura: levantamento prospectivo em bases patentárias

    Get PDF
    Added to blockchain technology is an exchange network for moving value, assets, and peer-to-peer transactions, without the need for intermediaries. Blockchain technology provides a means to ensure the permanence of records and potentially facilitate data sharing between different actors and can also be applied in production chains for agricultural production. This potential can lead to a paradigm shift, facilitating transparency and trust. In this way, the work proposes a prospective survey in patent banks on the blockchain, to show what is happening or the development of non-agribusiness technology. For this purpose, a quantitative method of prospective research was adopted using the Orbit® software. Among the results found, the main countries that hold blockchain technologies in the field of agriculture are China at 33.57%, followed by the United States at 20.86%, and Brazil appears in the chart with 3.42%. Therefore, it is concluded that despite recent patentability in this area, it is a trend of growth and diffusion of applications in society, since more than 34 thousand patents are still in the analysis phase.As aplicabilidades do blockchain estão associadas, principalmente, à segurança de dados e à possibilidade de infinitas transações excluindo intermediários, além disso, é possível, por meio de protocolo, gerar uma rede de pagamentos de baixo custo. Essa tecnologia tem sido utilizada em diversos setores da economia e referenciada como uma aposta para o agronegócio, facilitando as transações comerciais com transparência e confiança em todos os elos da cadeia produtiva. Dessa forma, o trabalho propõe um levantamento prospectivo em bancos de patentes sobre blockchain, com intuito de evidenciar em quais rumos está o desenvolvimento dessa tecnologia no agronegócio. Para tal, foi adotado o método de levantamento prospectivo quantitativo por meio do software Orbit®. Entre os resultados encontrados, os principais países detentores das tecnologias de blockchain dentro do campo da agricultura estão a China com 33,57%, em seguida os Estados Unidos com 20,86% e o Brasil aparece no gráfico com 3,42%. Portanto, conclui-se que, apesar de ser recente, a patenteabilidade nessa área se encontra em tendência de crescimento e de difusão das aplicações na sociedade, visto que mais de 34 mil patentes ainda se encontram em fase de análise

    Uma abordagem computacional para preenchimento de falhas em dados micro meteorológicos

    Get PDF
    Estações micro meteorológicas utilizam equipamentos para captar dados sobre fenômenos climatológicos. Essa captação está sujeita a falhas e influências externas que ocasiona ausência de dados no conjunto de dados gerados. Técnicas matemáticas e computacionais são comumente usadas com o objetivo de preencher essas falhas nos dados. Este trabalho apresenta uma abordagem computacional que utiliza técnica de redes neurais, combinada com algoritmos genéticos, aplicada a dados reais com o objetivo de preencher falhas em séries de temperatura em uma região de cerrado no estado de Mato Grosso. Nos testes realizados, os coeficientes de correlação variaram entre 0,79 e 0,96 e o erro médio absoluto entre de 0,62 e 1,22, mostrando um bom desempenho da rede neural para uma série de dados com valores ausentes

    APLICAÇÃO DE TÉCNICAS DE REPRESENTAÇÃO DE DADOS NO TRATAMENTO DE DADOS MICROCLIMÁTICOS

    Get PDF
    Os sensores instalados em estações meteorológicas podem gerar uma grande quantidade de dados todos os dias. Esses dados, eventualmente, precisam ser processados antes de serem analisados. Nesse processo, a quantidade de dados pode dificultar a sua manipulação, controle e interpretação. Inclusive para técnicas computacionais, a quantidade de dados são consequências de um maior tempo de processamento. Dessa forma, espera-se que reduzir a quantidade de dados possa facilitar, do ponto de vista computacional, a manipulação desse tipo de dado. Entretanto, a redução pode gerar perda de informação importante na série. Este trabalho avaliou a utilização de técnicas de representação de dados, com o intuito de reduzir a série de dados ao mesmo tempo que as características da série sejam conservadas. Testes foram realizados para avaliar a conservação das características da série de dados após a redução. Mesmo com a série reduzida em 80%, operações de tratamento de dados microclimáticos puderam ser realizadas com a mesma eficácia do que se fossem realizadas com a série original, indicando que as características originais da série foram mantidas. As técnicas de representação de dados com melhor desempenho foram Amostragem e Perceptually Important Points

    A formal approach for content-based image in relational database management systems

    No full text
    Sistemas de Recuperação de Imagens por Conteúdo (SiRICs) têm como objetivo realizar buscas em grandes coleções de imagens, recuperando aquelas cujos conteúdos são mais similares à uma imagem fornecida como parte do predicado de busca. A similaridade é expressada por uma função de distância (dissimilaridade) que calcula a relação entre um par de imagens para permitir que ambas sejam comparadas. Funções de distância usam características extraídas de cada imagem por um conjunto de algoritmos chamados extratores de características. Para melhorar o desempenho do processo de buscas, as características selecionadas são extraídas de cada imagem no momento em cada uma é armazenada na base de dados, criando um vetor de características para cada imagem. As operações subsequentes da busca são realizadas usando os vetores de características no0 lugar das imagens. Antes de extrair as características, outros algoritmos de processamento de imagem são utilizados para pré-processar cada imagem, de forma a prepará-la para os extratores. Adicionalmente, é comum a existência de vários critérios que podem ser considerados no processo de cálculo da similaridade de duas imagens. Nos SiRICs atuais, para comparar imagens, é preciso definir (1) o critério de comparação, (2) os pré-processamentos necessários para execução dos extratores, (3) quais são os extratores utilizados, (4) quais características devem ser consideradas, (5) e qual função de distância deve ser aplicada. Todas essas definições têm de ser configuradas antes da comparação ser realizada. A complexidade desse processo levou ao desenvolvimento de SiRICs com poucas opções para configuração das operações de comparação. Além disso, não existe nenhuma representação formal do processo SiRIC como uni todo. Este trabalho apresenta uma representação formal do conjunto completo de operações que compõem o processo de buscas por conteúdo em imagens, objetivando consultas por similaridade em grandes bases de dados relacionais. A aplicação desse formalismo é apresentada com os resultados experimentais gerados sobre imagens médicas de urna base de dados hospitalar.Content-Based Image Retrieval Systems (CBIR) aims at searching in large collections of images, retrieving those whose contents are similar to an image given as part of the search predicate. Similarity is a relationship between a pair of images that enables their comparison, which is expressed by a distance (dissimilarity) function. Distance functions usnally rely on a set of features extracted from each image by a set of image processing algorithms called featurc extractors. To speed up the search process, selected features are extracted from each image when each one is stored in a image database creating a feature vector for each image. Further image searching operations are performed using the feature vectors in place of the images. Before extracting features, other image processing algorithms are usually employed to pre-process each image, preparing it for the extractors. Moreover, usually there are several criteria that can be considered when measuring how much two images are similar. In current CBIR, environments, to compare images, one must define (1) the criteria, (2) the pre-processing needed before the extractors can be executed, (3) which are those extractors, (4) which features must be considered, (5) and which distance function must be used. Ali of these definitions must have been set before a comparison can be performed. The complexity of defining how to comparei images has lead to the development, of systems aiming CBIR that allow relatively few options to configure the image comparison operations. Moreover, no formal representation of the entire CBIR process exists. This work presents a formal representation of the complete set. of operations composing the CBIR process, aiming to search images in large relational databases, using similarity queries. It is also reported a system developed using this formalism that enables the content-based retrieval of medicai images from a hospital database, thus showing results of applying the presented formalism in a practical way

    A formal approach for content-based image in relational database management systems

    No full text
    Sistemas de Recuperação de Imagens por Conteúdo (SiRICs) têm como objetivo realizar buscas em grandes coleções de imagens, recuperando aquelas cujos conteúdos são mais similares à uma imagem fornecida como parte do predicado de busca. A similaridade é expressada por uma função de distância (dissimilaridade) que calcula a relação entre um par de imagens para permitir que ambas sejam comparadas. Funções de distância usam características extraídas de cada imagem por um conjunto de algoritmos chamados extratores de características. Para melhorar o desempenho do processo de buscas, as características selecionadas são extraídas de cada imagem no momento em cada uma é armazenada na base de dados, criando um vetor de características para cada imagem. As operações subsequentes da busca são realizadas usando os vetores de características no0 lugar das imagens. Antes de extrair as características, outros algoritmos de processamento de imagem são utilizados para pré-processar cada imagem, de forma a prepará-la para os extratores. Adicionalmente, é comum a existência de vários critérios que podem ser considerados no processo de cálculo da similaridade de duas imagens. Nos SiRICs atuais, para comparar imagens, é preciso definir (1) o critério de comparação, (2) os pré-processamentos necessários para execução dos extratores, (3) quais são os extratores utilizados, (4) quais características devem ser consideradas, (5) e qual função de distância deve ser aplicada. Todas essas definições têm de ser configuradas antes da comparação ser realizada. A complexidade desse processo levou ao desenvolvimento de SiRICs com poucas opções para configuração das operações de comparação. Além disso, não existe nenhuma representação formal do processo SiRIC como uni todo. Este trabalho apresenta uma representação formal do conjunto completo de operações que compõem o processo de buscas por conteúdo em imagens, objetivando consultas por similaridade em grandes bases de dados relacionais. A aplicação desse formalismo é apresentada com os resultados experimentais gerados sobre imagens médicas de urna base de dados hospitalar.Content-Based Image Retrieval Systems (CBIR) aims at searching in large collections of images, retrieving those whose contents are similar to an image given as part of the search predicate. Similarity is a relationship between a pair of images that enables their comparison, which is expressed by a distance (dissimilarity) function. Distance functions usnally rely on a set of features extracted from each image by a set of image processing algorithms called featurc extractors. To speed up the search process, selected features are extracted from each image when each one is stored in a image database creating a feature vector for each image. Further image searching operations are performed using the feature vectors in place of the images. Before extracting features, other image processing algorithms are usually employed to pre-process each image, preparing it for the extractors. Moreover, usually there are several criteria that can be considered when measuring how much two images are similar. In current CBIR, environments, to compare images, one must define (1) the criteria, (2) the pre-processing needed before the extractors can be executed, (3) which are those extractors, (4) which features must be considered, (5) and which distance function must be used. Ali of these definitions must have been set before a comparison can be performed. The complexity of defining how to comparei images has lead to the development, of systems aiming CBIR that allow relatively few options to configure the image comparison operations. Moreover, no formal representation of the entire CBIR process exists. This work presents a formal representation of the complete set. of operations composing the CBIR process, aiming to search images in large relational databases, using similarity queries. It is also reported a system developed using this formalism that enables the content-based retrieval of medicai images from a hospital database, thus showing results of applying the presented formalism in a practical way

    Transferência de Tecnologia e Estratégia Tecnológica se Completam

    Get PDF
    Some steps and procedures that may contribute to the transmission of the developed knowledge to transfer technology it is necessary to follow. In this sense, the objective of this article is to seek a better understanding of the concepts of Technology Transfer and the importance of a Technology Strategy through mechanisms to support innovation, seeking to raise in the literature its positive points, benefits and difficulties. It is important to highlight that technology transfer, combined with a technological strategy, innovation and public policies are key elements in the competitiveness of organizations, It is also mechanisms to create synergies between innovation actors: university, government, productive sector and society. Through bibliographic and documentary research, we present a proposal of the concepts and it was listed several support mechanisms. Finally, through all the study we concluded that there is a need to formulate technological strategies that boost the interaction between university and company, to promote socioeconomic development, for the benefit of society.Algumas etapas e procedimentos que venham a contribuir para a transmissão do conhecimento desenvolvido são necessárias para a transferência de tecnologia. Nesse sentido, o objetivo deste artigo é buscar uma melhor compreensão dos conceitos de Transferência de Tecnologia e importância de uma Estratégia Tecnológica por meio dos mecanismos de apoio de inovação, buscando levantar na literatura seus pontos positivos, benefícios e dificuldades. É importante destacar que a Transferência de Tecnologia, aliada a uma Estratégia Tecnológica, a Inovação e as Políticas Públicas são elementos chave na competitividade das organizações, sendo também mecanismos para criar sinergias entre os atores de inovação: universidade, governo, setor produtivo e sociedade. Através de pesquisa bibliográfica e documental, apresentamos uma proposta dos conceitos e diversos mecanismos de apoio. Enfim, por meio de todo o estudo realizado concluímos que existe a necessidade de formular Estratégias Tecnológicas que impulsionem a interação entre universidade e empresa, para promover o desenvolvimento socioeconômico em benefício da sociedade

    Aplicação de Inteligência Artificial no Ciclo de Políticas Públicas

    Get PDF
    The public policy cycle is a process that begins with the conflicting identification and prioritization of the public problem, the implementation of the solution, until the validation of the problem resolution. Currently, there are techniques, especially artificial intelligence, that can support the public administration to use the data under their control more efficiently in problem solving. This study explores how world governments apply artificial intelligence to public policy. Therefore, bibliometric, patentometric and documentary analyzes were applied, also observing the countries' national artificial intelligence strategies as an opportunity for development and strengthening. Brazil, although with scientific studies in the area, is far removed from this strategic development race. The biggest initiatives for the use of artificial intelligence are in the implementation phase of public policy and with less focus on identifying the public problem, according to the 201 articles and 46 patent documents analyzed in this study.O ciclo de política pública é um processo que inicia com a conflituosa identificação e priorização do problema público, a implementação da solução até a validação da resolução do problema. Atualmente existem técnicas, como a inteligência artificial, que podem apoiar a administração pública a utilizar com maior eficiência os dados sob sua tutela na resolução de problemas. Este estudo explora como os governos mundiais aplicam a inteligência artificial em políticas públicas. Para tanto, foram aplicadas análises bibliométrica, patentométrica e documental, observando ainda as estratégias nacionais de inteligência artificial dos países como oportunidade de desenvolvimento e fortalecimento. O Brasil, embora com estudos científicos na área, está muito afastado dessa corrida estratégica de desenvolvimento. As maiores iniciativas de uso de inteligência artificial estão na etapa de implementação da política pública e com menor foco na identificação do problema público, conforme os 201 artigos e 46 documentos de patente analisados neste estudo
    corecore